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Обзор баз знаний онтологического типа 


В статье рассматриваются вопросы построения, структурирования, описания, классификации и исполь- 
зования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным 
аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению 
формальных и лингвистических онтологий. Также предложена достаточно подробная методология 
построения ресурсов онтологического типа. 


Введение 


В настоящее время все большей популярностью пользуются методы инженерии 
знаний, среди которых онтологиям принадлежит значительное место. В связи с 
ростом популярности изучение онтологий включено в программу ВУЗов, по данной 
тематике выходит все большее количество статей. К сожалению, на наш взгляд, боль- 
шая часть русскоязычного материала (в том числе учебные пособия и некоторые ста- 
тьи) все еще чрезвычайно низкого качества. Как правило, такие материалы содержат 
части формальных выкладок из переводных источников или разработок отечествен- 
ных исследований. 

Данная статья является попыткой упорядочить и структурировать существующую 
сегодня информацию о создании и применении онтологий. 


1. Понятие онтологии 


В исследовании онтологий вопросы возникают с первых шагов. Так, до сих пор 
не существует единого определения для понятия онтология. Само понятие онтология 
происходит от др.-греч. «онтос» — сущее, «логос» — учение, понятие, т.е. это раздел 
философии, изучающий бытие. 

Википедия определяет онтологию (в информатике) как попытку всеобъемлющей 
и детальной формализации некоторой области знаний с помощью концептуальной схе- 
мы [1]. Под концептуальной схемой подразумевается набор понятий + информация о 
понятиях (свойства, отношения, ограничения, аксиомы и утверждения о понятиях, не- 
обходимых для описания процессов решения задач в избранной предметной области). 

Среди специалистов, занимающихся проблемами компьютерной лингвистики, 
наиболее устоявшимся (классическим) считается определение онтологии, данное Гу- 
бертом: «онтология — это спецификация концептуализации» [2]. 

Так же известен ряд расширенных определений Губерта, среди которых можно 
выделить такие: 

— онтология - это эксплицитная спецификация концептуализации, где в качестве 
концептуализации выступает описание множества объектов предметной области и 
связей между ними; 

— онтология - это знания, формально представленные на базе концептуализации. 
Формально онтология состоит из терминов, организованных в таксономию, их опре- 
делений и атрибутов, а также связанных с ними аксиом и правил вывода; 
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— онтология — формальная спецификация разделяемой концептуализации, которая 
имеет место в некотором контексте предметной области; 

— онтология - база знаний, описывающая факты, которые предполагаются всегда 
истинными в рамках определенного общества на основе общепринятого смысла ис- 
пользуемого словаря. 

Дополнительно с пониманием термина «онтология» по Губерту можно ознако- 
миться здесь [3]. Нужно отметить, что определение, данное в [1], полностью передает 
семантику всех вышеперечисленных определений, поэтому в данной работе будем 
придерживаться именно его. 


2.Виды онтологий 


Кроме проблем с точным определением самого понятия «онтология», существует 
также ряд проблем с описанием модели онтологии формальным языком [4]. Рассмотрим 
формальное описание онтологии, которое считается классическим: 

Онтология определяется как О = <Х,В,Е>, где 
—  Х- конечное множество понятий предметной области; 

— К- конечное множество отношений между понятиями; 
— Е конечное множество функций интерпретации [5]. 

Однако далеко не все существующие сегодня онтологические ресурсы подпадают 
под приведенное определение. Сегодня эволюция прикладных информационных 
систем идет в сторону повышения их интеллектуальности. Это оказывает существенное 
влияние на направление научных и технологических исследований, связанных с 
использованием компьютеров, а также предоставляет обществу практически значимые 
результаты. Однако на определенной ступени развития дальнейшее развитие технологий 
имеющимися средствами становится невозможным. В такие периоды нужен качествен- 
ный скачок используемых в разработке средств. Одним из таких скачков в области 
ИИ, направленным на дальнейшую интеллектуализацию систем взаимодействия с 
пользователем, и явилось появление онтологий. 

Поскольку онтологии были ответом науки на нужды своего времени, то и 
появление их произошло сразу в нескольких областях знания. Соответственно, в 
каждой из них ресурсы онтологического типа были сформированы по своим, 
специфичным для области знаний, правилам. 

Эту же точку зрения разделяют авторы работы [6], которые считают, что в проекти- 
ровании онтологий условно можно выделить два направления, до некоторого времени 
развивавшихся отдельно. 

Первое связано с представлением онтологии как формальной системы, основан- 
ной на математически точных аксиомах (т.е. это ресурсы онтологического типа, с03з- 
данные в различных областях математики). 

Второе направление развивалось в рамках компьютерной лингвистики и когни- 
тивной науки. Здесь онтология понималась как система абстрактных понятий, сущест- 
вующих только в сознании человека, которая может быть выражена на естественном 
языке (или средствами какой-то другой системы символов). При этом обычно не 
делается предположений о точности или непротиворечивости такой системы. 

Таким образом, существует два альтернативных подхода к созданию и исследова- 
нию онтологий. Первый (формальный) — основан на логике (предикатов первого по- 
рядка, дескриптивной, модальной и т.п.). Второй (лингвистический) — основан на изуче- 
нии естественного языка (в частности, семантики) и построении онтологий на больших 
текстовых массивах, так называемых корпусах. 


«Штучний 1нтелект» 472009 209 


Никоненко А.А. 


4Н 


3.Классификация онтологий 


Существуют различные типы классификации онтологий. С нашей точки зрения, 
наиболее полезным будет выделить два типа классификации онтологий: 

Семантическая: 

1) по уровню выразительности [7]; 

2) по степени формальности [6]; 

3) по уровню детальности представления [8]. 

Прагматическая: 

4) по степени зависимости от конкретной задачи или прикладной области [9]; 

5) по языку представления онтологических знаний [9]; 

6) по предметной области [9]; 

7) по цели создания [6]; 

8) по наполнению (содержимому) [6]. 

Приведем краткую характеристику каждой классификации. 


Семантическая классификация 


1. По уровню выразительности 

Тяжеловесные онтологии. Тяжеловесные онтологии сильно аксиоматизированы, 
такой уровень аксиоматизации позволяет осуществлять онтологическое связывание 
явно. Цель аксиоматизации — избежать терминологической и концептуальной неодно- 
значности из-за неправильной интерпретации. Каждая тяжеловесная онтология может 
иметь легковесную версию. Многие онтологии предметных областей (4отат) — тя- 
желовесные, т.к. должны поддерживать процессы построения сложных умозаключе- 
ний. Как и в определении любых размеров, граница между тяжеловесными и легко- 
весными онтологиями размыта. 

Легковесные онтологии. Это простые таксономические структуры примитивов 
или композиции термов с соответствующими определениями. Они слабо аксиоматизи- 
рованы, т.к. значение термина, используемое внутри комьюнити, обычно более-менее 
известно всем членам сообщества. Соответственно, связи между терминами, которые рас- 
сматриваются как релевантные, могут быть представлены в онтологии ограниченно [7]. 

2. По степени формальности 

Данная классификация схожа с классификацией по уровню выразительности язы- 
ка описания онтологии (см. предыдущий пункт), однако не эквивалентна ей. 

Неформальные. Это онтологии, которые описываются в документе на любом 
естественном языке (английский, русский, украинский и т.д.). Несмотря на отсутствие 
формальных правил задания, такие онтологии также могут быть богато наполненными, 
непротиворечивыми и точными. 

Более формализованные. Таксономия может быть двух видов — основанная на 
термах или на концептах. Такие онтологии, хотя и формализованы, но очень слабо 
структурированы. Например, структурированные связями «уже чем» или «подкласс» 
(пагго\уег_ ап ог забс1аз$): 

— основанные на термах. В этом случае в иерархии тематического раздела бо- 

лее общие термины находятся выше, по мере спуска по иерархии термины ста- 

новятся все более специфичными; 

— основанные на концептах. Иерархия состоит из классов и их подклассов, в 

которых отображаются их отличительные и необходимые свойства. 

Сильно формализованные. Онтологии для решения инженерных уравнений. 
Задают формальную семантику термов (таких, как количество и единица измерения) 
в разрешенных языком точных и непротиворечивых выражениях [8]. 
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3. По уровню детальности представления 

Некоторые количественно-измеримые метрики могут быть применены к рас- 
чету уровня детальности представления. Например, средняя глубина структуры под- 
классов/подхарактеристик (зибргорейу), средняя кучность/кустистость (Ба$тез$), ко- 
личество аксиом и другие. 

Низкий. Онтология может быть построена на основе терминов и нескольких 
типов связей. 

Примеры: 

— простая таксономия; 

— очень формальная онтология, описанная в терминах общей логики (Соттоп 

Го21с), но содержащая только 3 класса и 2 свойства. 

Высокий. Онтология может содержать намного больше деталей, включая прави- 
ла, по которым термины могут быть связаны между собой. 

Примеры: 

— очень детализированное описание биологических классов и их отличительных 

особенностей на естественном языке; 

— очень формальная онтология, описанная на одном из языков КТЕ, СГ, Сус-Г, 

ОМТ--5У\У/ВГ, которые содержат тысячи классов, свойств, правил и миллионы 

экземпляров/индивидуумов [8]. 


Прагматическая классификация 


4. По степени зависимости от конкретной задачи или прикладной области 

Верхнего уровня. Такие онтологии описывают наиболее общие концепты (про- 
странство, время, материя, объект, событие, действие и т.д.), которые не зависимы от 
конкретной проблемы или области. Примером такой общей онтологии является ком- 
мерческий проект онтологии СУС. 

Ориентированные на предметную область. Во многих дисциплинах сейчас 
разрабатываются стандартные онтологии, которые могут использоваться экспертами 
по предметным областям (доменам) для совместного использования и аннотирова- 
ния информации в своей области. Например, в области медицины созданы большие 
стандартные, структурированные словари, такие как ЗМОМЕР и семантическая сеть 
Системы унифицированного медицинского языка (®е Отйед Меса| Гапоцазе Зуует). 
Также появляются обширные общецелевые онтологии, например, онтология ОМ$РЗС, 
которая предоставляет терминологию товаров и услуг. 

Ориентированные на задачу. Это онтология, используемая конкретной приклад- 
ной программой и содержащая термины, которые используются при разработке ПО, 
выполняющего конкретную задачу. Она отражает специфику приложения, но может 
также содержать некоторые общие термины (например, в графическом редакторе 
будут и специфические термины -— палитра, тип заливки, наложение слоев и т.д., и 
общие — сохранить и загрузить файл). 

Прикладные онтологии описывают концепты, которые зависят как от онтологии 
задач, так и от онтологии домена. Примером может служить онтология для автомобилей, 
строительных материалов, вычислительной техники [9]. 

5. По языку представления онтологических знаний 

ВОЕ. Язык разработан в рамках проекта Семантик-веб (Зетапис \/еБ). Основное 
предназначение языка — описание метаданных документов, размещаемых в Интернете. 
ВПЕ использует базовую модель представления данных «объект — атрибут — значение», 
и способен сыграть роль универсального языка описания семантики ресурсов и связей 
между ними. 
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РАМГЕ-ОП, -— семантический язык разметки \е-ресурсов, который расширяет 
стандарты КОРЕ 1 КЕ Зсрета за счет более полных примитивов моделирования. 
В последнюю версию РАМГ-ОП, включен набор дополнительных конструкций для 
создания онтологий и разметки информации в легкоинтерпретируемом машиной виде. 

ОУУГ, (\еЬ Опю|о2у Гапепазе) — язык представления онтологий следующего по- 
коления после РАМТ-ОП.. Обладает более богатым набором возможностей, чем ХМГ, 
ВПЕ, ВПЕ ЗсБета 1 РАМГ+ОП.. Проект предполагает создание мощного механизма 
семантического анализа. Планируется, что в нем будут устранены ограничения 
конструкций РАМГ-ОП.. Онтология ОУ\Т, — это последовательность аксиом, фактов и 
ссылок на другие онтологии. 

ЮКЕ (Кпо\е4се Пиегсрапое Еотта*, или формат обмена знаниями) — основан 
на $-выражениях синтаксиса для логики. КТЕ — специальный язык, предназначенный 
для обмена знаниями между разными компьютерными системами. Разрабатывался для 
описания общего формата представления знаний, независимого от конкретных систем. 

СусТ, (язык описания онтологии Сус) — это гибридный язык, в котором объеди- 
нены свойства фреймов и логики предикатов. Синтаксис языка СусГ, схож с синтак- 
сисом языка Глзр. СусГ, различает такие сущности, как экземпляры, классы, предикаты 
и функции. Словарь СусГ., состоит из термов. Множество термов можно разделить на 
константы, неатомарные термы и переменные. Термы используются при составлении 
значащих выражений СусГ, из которых формируются суждения. Из суждений состоит 
база знаний [10]. 

ОСМИ, (Орегайопа! Сопсерша! Модейп» Гапеиаее) язык поддерживает построе- 
ние нескольких типов конструкций представления знаний. Он позволяет задавать специ- 
фикацию и операционализацию функций, связей, классов, экземпляров и правил. Он 
также включает механизмы для описания онтологий и методов решения задач — основ- 
ные технологии, разработанные в области представления знаний. Около десятка проек- 
тов в КМ! (Кпо\е4ее МеФа шзНйще) в настоящее время используют ОСМЕ. для разра- 
ботки моделей в таких областях, как управление знаниями, разработка онтологии, 
электронная торговля и системы обработки знаний [11]. 

ГООМ и Роме Г оот® -— языки представления знаний, разработанные исследова- 
телями из группы Агийс!а| ПиеШеепсе Кезеагсв Оточр [12] Университета Южной 
Калифорнии (Ошхегзйу оРЗоиеги Са®юпта'5 шЮппайоп Зс1епсез шзийще). Цель проекта 
Гоот -— разработка и внедрение продвинутых средств для представления знаний и рас- 
суждений в области искусственного интеллекта. Гоот и Ро\\е|Йоот распространяются 
по открытой лицензии (ореп зоигсе Псепзез), но являются интеллектуальной собствен- 
ностью Университета Южной Калифорнии и не являются общедоступными. 

Гоот — это и язык и среда для построения интеллектуальных приложений. Центром 
языка является система представления знаний, которая используется для построения 
дедуктивных выводов на основе декларативных знаний. Декларативные знания состоят 
из определений, правил, фактов и правил по умолчанию. Дедуктивный движок исполь- 
зует прямые цепочки логического вывода, семантическую унификацию и объектно- 
ориентированные технологии поддержания достоверности [13]. 

ОшюоЙпепца предоставляет распределенную среду для совместного просмотра, 
создания, редактирования, изменения и использования онтологий. Сервер поддерживает 
более 150 активных пользователей, с некоторыми проектами которых можно ознако- 
миться по адресу ЮИр://опю|печа.апЮг4.еди/Чос/опюозу-зегуег-ргодесз.0 [14]. Опю- 
Ппоца состоит из КТЕ парсера, инструментов для анализа онтологии, и набора тран- 
сляторов для преобразования исходных данных Ошю|пепа в форму, приемлемую для 
внедрения в системы представления знаний [15]. 
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Е-Гоз1с — онтологический язык, который базируется на логиках первого порядка, 
однако классы и свойства в нем представлены как термины, а не как предикаты. 
Язык создавался для осуществления взаимодействия между онтологиями, построенными 
на основе предикатов, и онтологиями, построенными на основе Е-Г.о?1с. Создатели 
определили интуитивные трансляторы для преобразования знаний из предикатных 
онтологий в Е-[.021с онтологии и показали, что такой перевод сохраняет логические 
связи (ргезегуез етщаШтеп) для большого количества онтологических языков, в том 
числе и для многих ОУТ, ОГ. Также язык может применяться для метамоделирования 
расширений БезсирНоп Г.021с$ (у-зетапйс$з) [16]. 

6. По предметной области 

Онтология отражает общие знания о предметной области, такие, как иерархия 
классов понятий и семантические отношения на этих классах. Для каждой предметной 
области онтологии создаются экспертами своей области, которые проводят формали- 
зацию знаний, определений и правил получения новых знаний. Для создания и под- 
держки онтологий существуют как спецификации, так и инструменты (описаны в [17]). 

7. По цели создания 

Онтологии приложения. Используются во время выполнения конкретного 
приложения, осуществляющего онтологическое нанесение ограничений на аксиоматиза- 
цию для терминологической службы, т.е. используются в работе блока построения 
рассуждений. Типичный компромисс между выразительностью и разрешимостью 
требует ограниченного представления формализмов. В приложениях, построенных 
на принципах описательных логик (ОГ), это будет совпадать с ТВох. Онтологии 
приложения могут также описывать конкретные миры (семантические описания, базы 
знаний, метаданные, семантические метаданные или просто экземпляры). В при- 
ложениях на базе описательных логик это будет совпадать с АВох. 

Ссылочные онтологии. Используются во время разработки приложений, для 
взаимного понимания и толкования между агентами, принадлежащими к разным 
сообществам, для установления консенсуса между сообществами, которые нуждаются 
во введении нового термина, или просто для пояснения значения термина новому 
участнику сообщества. Хотя части ссылочной онтологии могут быть также формали- 
зованы, как ТВох, однако описательные логики обычно не достаточно выразительны, чтоб 
использовать их в качестве справочных материалов [7]. 

8. По наполнению (содержимому) 

Данная классификация (рис. 1) очень похожа на классификацию по цели создания, 
однако акцент делается на реальное содержимое онтологии, а не на абстрактную 
цель, преследуемую авторами [6]. 

Дополнительно можно ввести и другие классификации. 

Например, онтологии могут быть также разделены на одноязычные и много- 
язычные. Уже существует ряд онтологий, ориентированных на представление знаний на 
нескольких языках, например, Еиго\/ог4 Ме, МгоКо5то$ и некоторые другие. Слож- 
ность создания таких онтологий обычно заключается в том, что возможно наличие 
различий в понятийных системах разных языков. 

Также все онтологии могут быть разделены на глубинные и поверхностные. 
Поверхностные онтологии строятся на поверхностной семантике, они определяют 
понятия через значения слов. Однако здесь возникает проблема, какое количество 
смыслов выделять для каждого слова. Глубинные же онтологии используют глубинную 
семантику [18]. 

Иногда лексические (лингвистические) онтологии включают в классификацию 
как отдельный тип. Отличительным свойством таких онтологий является «фиксация 
в одном ресурсе (лексикализованных) понятий (слов) вместе с их языковыми свойст- 
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вами». Такие онтологии тесно взаимосвязаны с семантикой грамматических элемен- 
тов (слов, именных групп и др.). Основным источником понятий в онтологиях дан- 
ного типа являются значения языковых единиц. Их также отличает своеобразный 
набор отношений, обычно свойственный для языковых элементов: синонимия, гипо- 
нимия, меронимия, а также ряд других. К лингвистическим онтологиям авторы отно- 
сят \!огаМе, МгоКо5110$, Зепзиз, РУТез и другие. Круг задач, решаемых такими 
онтологиями, тесно взаимосвязан с обработкой естественного языка [19]. 


Сущности, События, 
Пространство, Время... 


Составления расписаний, 
определение целей, 
классификация 


Множества предметов: скальпели, 
сканеры, 


Рисунок 1 — Схема классификации онтологий по наполнению 


4. Структура формальных и лингвистических онтологий 


Формальная онтология — это система, которая состоит из набора понятий и 
набора утверждений об этих понятиях, на основе которых можно строить классы, 
объекты, отношения, функции и теории. 

Большинство моделей онтологий содержат такие компоненты: 

— концепты (понятия, классы); 

— свойства концептов (атрибуты, роли); 

— отношения между концептами (зависимости, функции); 

— дополнительные ограничения, которые определяются аксиомами; 
— примеры использования. 

В роли концепта может выступать описание задачи, функции, действия, стратегии, 
процесса соображения и т.д. Основное отличие онтологической системы от обычного 
словаря — внутреннее единство, логическая взаимосвязь и непротиворечивость 
используемых понятий. 

При построении онтологических систем стараются соблюдать следующие правила: 
— формализации, т.е. описания объективных элементов действительности в единых, 
строго определенных образцах (терминах, моделях и др.); 

— использования ограниченного количества базовых терминов (сущностей), на основе 
которых конструируются все остальные понятия; 
— внутренней полноты и логической непротиворечивости [9]. 

Формально эти правила представлены следующими пятью принципами: 

1. Принцип полноты. Категории верхнего уровня должны исчерпывающим 
образом представлять Материю; за пределами этих категорий не должно существовать 
никаких проявлений сущего. 
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2. Принцип естественнонаучности и проблемной ориентации. Все категории и 
концепты онтологии должны быть выражены понятиями, которые установились в 
естественных и математических науках при изучении материального мира и являются 
общепринятыми. При этом часть онтологии должна быть представлена концептами, 
которые широко используются в междисциплинарных текстах (с нейтральной, обще- 
доступной лексикой), а вторая часть онтологии структурируется под конкретную 
область знаний (ПрО). Первая часть имеет постоянный статус, а проблемно-ориентиро- 
ванная онтология формируется специалистом и носит переменный характер. 

3. Принцип взаимосвязанности уровней. Категории онтологии верхнего уровня 
раскрываются наборами концептов среднего уровня. В свою очередь, концепты 
нижнего уровня должны служить определителями для терминов словаря Про. Связь 
между средним и нижним уровнями организуется с помощью именованных отношений 
вида: «быть частью», «принадлежать множеству», «совпадать с», «находиться в 
семантическом отношении с». 

4. Принцип ассоциативности. Концепты онтологии нижнего уровня должны 
служить полем для индексирования терминов ПрО. При этом используются семанти- 
ческие отношения вида: «находиться в ассоциативной связи с». 

5. Принцип отражения антагонизмов. Концепты, которые отражают свойства 
или понятия, имеющие свою противоположность или дополнительность по равному 
основанию, входят в онтологию парами или тройками полярных обозначений [20]. 

Второй вид онтологий - это иерархические лексические ресурсы типа У/огаМее. 
При описании ресурсов этого типа мы будем использовать информацию, представ- 
ленную в работе [21]. У/ог4аМе-ресурсы описывают лексические отношения между 
значениями слов, представленные в виде отдельных единиц в иерархической сети — 
синсетов. Отношения между лексическими единицами в значительной мере отражают 
отношения объектов внешнего мира, поэтому такие ресурсы часто рассматриваются 
как особый вид онтологий -— лексические или лингвистические онтологии. 

Главной характеристикой лингвистических онтологий является то, что они 
привязаны к значениям (аге Боцп4 №ю Ше зетапис$) языковых выражений (слов, 
именных групп и т.п.). Лингвистические онтологии охватывают большинство слов 
языка и одновременно имеют онтологическую структуру, проявляющуюся в отношениях 
между понятиями. Поэтому лингвистические онтологии могут рассматриваться как 
особый вид лексической базы данных и особый тип онтологии. 

Основное отличие лингвистических и формальных онтологий — это степень 
формализации. Предполагается, что при разработке ресурсов такого типа строится 
иерархия лексических значений естественного языка, а для более строгого описания 
знаний о мире необходимо сопоставить такие ресурсы с какими-либо формальными 
онтологиями. 

Так, содержанием одного из проектов является установление отношений между 
УМ/огаме{ и Еиго\!огаМеь, с одной стороны, и формальной онтологией ЗОМО - З‘ап- 
аг4лтеа Оррег Мегоед Ощо]оэу - с другой. Проект состоит в том, чтобы установить 
соответствие между синсетами \\огаМе( и понятиями онтологии, при котором каж- 
дый синсет \/огАМе либо напрямую сопоставляется с понятием онтологии, либо явля- 
ется гипонимом для некоторого понятия или экземпляром (элементом) понятия он- 
тологии. 

Участники другого проекта — Опю\\!огаМе! — считают, что недостаточно провести 
формальную склейку ресурса типа \!ог4Ме и формальной онтологии: необходима 
значительная реструктуризация исходного лексического ресурса. Соответствующая 
работа проводится в проекте Сус. 
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5. Методология построения онтологии 


На тему «как построить онтологию» существует множество рекомендаций, ру- 
ководств, советов, подсказок и указаний. Однако до сих пор не предложено общей 
методологии построения онтологий. Некоторые шаги в этом направлении были пред- 
приняты в следующих работах: 

— ГШЕЕ5: язык и метод для описания онтологий [22]; 

— статья Грубера, в которой приведено обсуждение принципов описания онтоло- 
гий [23]; 

— статья Скуса, посвященная вопросам согласования, как пути для совместного ис- 
пользования и интеграции онтологий, разработанных разными группами [24]; 

— статьи Гомез-Переза, посвященные технологиям совместного использования зна- 
ний [25]. 

Указанные выше работы приводят дальнейшие шаги в развитии методологии, 
но не предлагают базовой ($Ке|ейа]) методологии. Далее в этом разделе мы попытаемся 
вывести такую базовую методологию, опираясь на работы [9] и [26]. Такая методология 
должна включать ограниченное число стадий и быть применимой к построению 
любой онтологии. 

В работе [26] авторы считают, что комплексная базовая методология для 
разработки онтологий должна включать следующие стадии: 

— Определение цели. 

— Построение онтологии. 

— Зафиксировать онтологию. 
— Закодировать онтологию. 
— Провести интеграцию существующих онтологий. 

— Оценить. 

— Задокументировать. 

Дополнительно для каждой стадии должны быть описаны технология, методика, 
принципы и рекомендации, например, типы связей между стадиями (рекомендуемый 
порядок, чередование, входы/выходы). 

Дадим краткую характеристику описанным выше стадиям. 


Определение цели 


Эта стадия необходима для четкого понимания, почему онтология была создана и 
для каких целей она будет использована. Она также будет, использоваться для опре- 
деления круга пользователей онтологии. 


Построение онтологии 


Фиксирование 

Под фиксированием подразумевается: 

1. Определение ключевых концептов и связей в нужном домене (зсор1пэ). 

2. Выработка точных, непротиворечивых текстовых определений для этих концептов и 
связей. 

3. Определение термов, относящихся к таким концептам и связям. 

4. Согласование всего вышеперечисленного. 
Кодирование 

Под кодированием подразумевается точное представление деталей, зафиксированных на пре- 
дыдущей стадии, на каком-либо формальном языке. Это включает в себя фиксацию определенной 
мета-онтологии, выбор языка представления, и создание описания онтологии на этом языке. 
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Интеграция 

На этапах фиксирования и кодирования часто возникает вопрос, можно ли как-то 
воспользоваться уже существующими онтологиями. В общем случае это очень сложная 
проблема, хотя, например, в проекте ОпюПпета был достигнут значительный прогресс в этом 
направлении. Разработка руководства и инструментария в данной области стало бы одним 
из наиболее значительных прорывов в области разработки комплексной методологии. 
Оценка 

Гомез-Перез предложил следующее определение оценки в контексте технологий совмест- 
ного использования знаний: «для составления технического мнения об онтологии, ассоцииро- 
ванной с ней программной среды и документации, касательно критериев... Критериями могут 
выступать требования к спецификации, вопросы компетенции, и/или реальный мир» [25] 
Документирование 

Может быть желательным определить рекомендации к документированию онтологий, 
возможно, различные, в зависимости от типа и предназначения онтологии. Как показано в 
работе [24], одним из основных препятствий в эффективном совместном использовании знаний 
является недостаточная документация по существующим базам знаний и онтологиям. Поэтому 
все важные допущения должны быть задокументированы, как об основных концептах, 
определенных в онтологии, так и о примитивах, используемых в определениях. 

Как итог, приведем список действий (подробнее в работе [9]), которые необходимо 
выполнить при построении онтологии: 
— обозначение целей и области применения создаваемой онтологии; 
— построение онтологии, которое включает: 
а) фиксирование знаний о ПрО, т.е. определение основных понятий и их взаимоотношений в 
выбранной предметной области; создание точных непротиворечивых определений для 
каждого основного понятия и отношения; определение терминов, которые связаны с этими 
терминами и отношениями; 
Ь) кодирование, т.е. разделение совокупности основных терминов, используемых в онтоло- 
гии, на отдельные классы понятий; 
с) выбор или разработку специального языка для представления онтологии; 
4) непосредственно задание фиксированной концептуализации на выбранном языке пред- 
ставления знаний; 
— совместное использование людьми или программными агентами общего понимания струк- 
туры информации; 
— обеспечение возможности использования знаний Про; 
— создание явных допущений в ПрО, лежащих в основе реализации; 
— отделение знаний ПрО от оперативных знаний — это еще один вариант общего применения он- 
тологий; 
— анализ знаний в Про. 


6. Применение онтологий 


Потребность в онтологиях связана с невозможностью адекватной автоматической 
обработки естественноязыковых текстов существующими средствами. Так, например, 
создание тезаурусов не решает проблему, т.к. различные группы пользователей и 
сообщества, занимающиеся обработкой и анализом информации, используют специаль- 
ную терминологию, которая может применяться другими сообществами в ином 
контексте. Также в различных сообществах часто встречаются различные обозначения 
для одних и тех же понятий. 

Поэтому для качественной обработки текстов необходимо иметь детальное опи- 
сание проблемной области с множеством логических связей, которые показывают 
соотношения между терминами области. Использование онтологий позволяет пред- 
ставить естественноязыковый текст в таком виде, что он становится пригодным для 
автоматической обработки. 
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Дополнительно онтологии могут использоваться в качестве посредника между 
пользователем и информационной системой, что позволяет формализовать используемые 
термины между всеми пользователями проекта. 

Также широкое применение нашли задачи онтологического анализа. В рамках этих 
задач с помощью онтологического исследования накапливают ценную информацию о 
функционировании сложных систем. Такой анализ обычно начинается с составления 
словаря терминов, который используется при обсуждении и исследовании характеристик 
объектов и процессов, составляющих рассматриваемую систему, а также создания 
системы точных определений этих терминов. Кроме того, документируются основные 
логические взаимосвязи между соответствующими терминами и понятиями. Результатом 
этого анализа является словарь терминов, их точных определений и взаимосвязей между 
ними. Собранную информацию используют при проведении процесса реорганизации 
существующих или построения новых систем. 

Более подробную информацию по использованию онтологий можно найти в 
работе [27]. 
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А.О. Никоненко 

Огляд баз знань онтолочного типу 

У статт! розглядаються питання побудови, структурування, опису, класиф\каци та використання 
онтологчних баз знань. Наведено огляд сучасних досллджень, присвячених р!зним аспектам створення 1 
використання онтологий. Особливу увагу в робот! присвячено розмежуванню формальних 1 л1нгв1стичних 
онтологй. Також запропоновано досить детальну методолопю побудови ресурав онтолойчного типу. 


А.А. МуКопепко 

Тве Ошоо1са1 Кпоу[едое Вазе$ Ве\1е\у 

ш Фе агасе Фе 1556$ оЁ сопзгасНоп, змасфитайоп, дезсирНоп, с1а5$1НсаНоп ап4 зе оЁ фе опю]оз1са1 
Кпо\Медее Базе аге сопз14егед. ТВе теме оЁ фе тодегп гезеагсКез, 4еЧсайе4 1ю Иегеп{ азресё5 оЁ отюю?гу 
и5е апа Юптаноп, 1$ таде. Зресла| айепйоп 15 отуеп ю фе дейтиаНоп оЁ ога] ап Ппэи1$Яс ото]021е$. 
ТБе деаПе4 тефо4о]озу оЁ опю]02у гезоигсез БаЙаше 15 оЙеге4 аз ме. 
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